python llama.py models/llama-2-7b wikitext2 --wbits 4 --load /data/hongyi/SqueezeLLM/models/llama-2-7b/sq-llama-7b-w4-s5.pt --eval